ELiRF-UPV en TweetLID: Identificación del Idioma en Twitter
نویسندگان
چکیده
This paper describes the participation of the ELiRF research group of the Universitat Politècnica de València in the Twitter Language Identification Workshop (tweetLID 2014). This workshop is a satellite event of the XXX edition of the Annual Conference of the Spanish Society for Natural Language Processing. This work describes the approaches used for the two tasks of the workshop, the results obtained and a discussion of these results.
منابع مشابه
Identificación Automática del Idioma en Twitter: Adaptación de Identificadores del Estado del Arte al Contexto Ibérico
We describe here our partipation in TweetLID. After having studied the problem of language identification, the resources available, and designed a text conflation approach for this kind of tasks, we joined the competition with two systems: the first one was based in the guesser langdetect, re-trained and adapted in order to work with conflated text; the second one was an approach based on major...
متن کاملELiRF-UPV en TASS 2016: Análisis de Sentimientos en Twitter
This paper describes the participation of the ELiRF research group of the Universitat Politècnica de València at TASS2016 Workshop. This workshop is a satellite event of the XXXII edition of the Annual Conference of the Spanish Society for Natural Language Processing. This work describes the approaches used for the two tasks of the workshop, the results obtained and a discussion of these result...
متن کاملELiRF-UPV en TASS 2015: Análisis de Sentimientos en Twitter
This paper describes the participation of the ELiRF research group of the Universitat Politècnica de València at TASS2015 Workshop. This workshop is a satellite event of the XXXI edition of the Annual Conference of the Spanish Society for Natural Language Processing. This work describes the approaches used for all the tasks of the workshop, the results obtained and a discussion of these results...
متن کاملMetodología basada en grafos para la identicación de perfiles de usuario
Resumen. En la presente investigación se propone un modelo para la identi cación de per les de usuario, a través de la creación y análisis de un grafo de co-ocurrencia. Se utilizan 4 corpus en Inglés: de Blogs, de Redes sociales, de Críticas y de Twitter y 2 corpus en Español: de Blogs y de Críticas para el desarrollo de los grafos. Para la creación y extracción de la información del grafo se h...
متن کاملAnálisis sobre el idioma español en México, con base en la frecuencia de palabras azules, rojas, obscenas y vulgares en Twitter
Resumen. En este artículo se presenta una comparativa entre estados de la República Mexicana de la frecuencia de palabras azules, rojas, obscenas y vulgares que escriben usuarios de la red social de microblogging Twitter. Se presentan gráficas de los resultados obtenidos. El objetivo es mostrar en mapas del comportamiento de la frecuencia de palabras por cada estado y clasificados por el tipo d...
متن کامل